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机 器 学 习 在 发 展 性 阅读 障碍 儿童 早期 筛 查 中 的 应 用 


5 Е Ж ТЕ 王 м 


(华东 师范 大 学 教育 学 部 特殊 教育 学 系 ， 上海 200062) 


摘 要 发 展 性 阅读 障碍 严重 影响 儿童 的 学 业 成 就 、 心 理 健康 和 社会 适应 能 


。 近 年 来 ， 机 器 学 习 因 其 强大 


的 数据 处 理 和 挖 据 能 力 逐 渐 被 应 用 到 阅读 障碍 儿童 的 早期 得 查 中 ， 在 标准 化 心理 教育 测试 、 眼 动 追 踪 、 游 戏 
测试 、 脑 成 像 等 多 个 领域 积累 了 较为 丰富 的 成 果 ， 获 得 了 更 加 精准 高 效 、 灵 活 可 靠 的 分 类 结果 。 然 而 ， 机 器 学 


习 在 对 象 选 取 、 数 据 采 集 、 


转化 潜力 和 安全 隐私 等 方面 仍 存在 局 限 性 。 未 来 研究 需要 重点 关注 学 龄 前 阅读 障 


碍 儿童 的 早期 筛 查 系 统 的 科学 性 ， 同 时 积极 构建 多 模 态 数据 库 、 在 多 种 算法 中 寻找 最 佳 算法 以 获取 最 优 参 数 ， 


最 终 实现 临床 实践 中 的 广泛 使 用 。 
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分 类 号 R395 
1 引言 


发 展 性 阅读 障碍 (Developmental dyslexia, DD) 
是 一 种 极其 复杂 的 神经 发 育 性 障碍 ， 其 核心 特征 
是 尽管 个 体 的 智力 正常 ， 视 .听觉 功能 完好 ， 但 是 
仍然 表现 出 持续 的 阅读 、 拼 写 和 写作 困难 (Kaisar, 
2020)。 阅读 障 人 碍 在 不 同 的 语言 和 文化 中 的 发 生 率 
约 为 5%~15% (Tamboer et al., 2016), 并 有 旦 存在 代 
际 传递 现象 (Zahia et al., 2020). 目前 ， 儿 童 通常 在 
2 年 级 或 更 高 年 级 在 掌握 阅读 技能 的 过 程 中 才 有 
可 能 被 识别 出 存在 阅读 障碍 (Sanfilippo et al., 
2020)。 在 经 济 发 展 落后 的 国家 , 贫困 儿童 发 现存 
在 阅读 障碍 的 年 龄 更 晚 (Ballester et al., 2021)。 此 
时 往往 已 经 错过 了 最 佳 的 干预 窗口 期 ， 即 幼儿 园 
至 1 年 级 大 脑 可 塑性 增强 的 早期 阶段 (Fox et al., 
2010)。 大 量 人 研究 已 然 发 现 ， 患 有 阅读 障碍 的 儿童 
会 深 陷 学 习 成 绩 低下 、 自 我 效能 感 降 低 和 学 习 动 
力 不 足 的 恶性 循环 中 (Burns et al., 2022), HAH 
现 极 高 的 辍学 率 和 心理 健康 问题 (Livingston et al., 
2018)。 如 果 此 类 儿童 未 能 得 到 及 时 的 识别 和 干预 ， 
阅读 障碍 的 负面 影响 可 能 会 从 童年 早期 一 直 持 续 
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至 成 年 期 (Farah et al., 2021)。 因 此 ， 进 行 高 效 的 早 
期 第 查 ,提供 有 效 的 早期 干预 ,对 于 阅读 障碍 儿 
童 的 发 展 具 有 关键 性 意义 。 

迄今 为 止 ， 阅 读 障 得 的 得 查 主要 借助 于 标准 化 
心理 教育 测试 (Lee et al., 2022)、 有 眼 动 追 踪 (Prabha 
& Bhargavi, 2019)、 网 络 /手机 游戏 (Borleffs et al., 
2018) 以 及 脑 成 像 技 术 (Usman et al., 2021) 等 手段 。 
标准 化 心理 教育 测试 通常 采用 智商 -成 就 差异 模 
xk (IQ-achievement discrepancy) (Fletcher et al., 
2019), РЎ -ЛУ 0 20 (response to intervention, 
RTI) (Miciak et al., 2014)、 优 势 与 弱势 模式 (pattern 
of strengths and weaknesses, PSW) (Hale et al., 
2010) 来 评估 和 量化 个 体 的 智力 、 语 音 加 工 、 阅 读 
技能 和 词汇 发 展 等 认 知 能 力 ， 进 而 达到 识别 阅读 
障碍 者 的 目的 (Miciak & Fletcher, 2020)。 就 眼 动 追 
踪 技 术 的 应 用 而 言 ,， 人 研究 者 通过 记录 阅读 过 程 中 
的 眼 动 特征 来 区 分 阅读 障碍 儿童 和 非 阅 读 障碍 儿 
童 ， 这 些 特征 包括 注视 / 回 视 时 间 和 次 数 、 眼 跳 幅 
度 和 次 数 、 甩 眼 频 率 和 次 数 以 及 双眼 协调 性 等 
(Hmimdi et al., 2021)。 也 有 研究 者 以 游戏 化 的 形 
式 生成 具体 的 语音 测试 或 认 知 测试 ， 开 发 基于 网 
络 技术 的 电子 学 习 系 统 和 手机 游戏 (例如 ，Deslixate 
和 GraphoGame)， 和 旨 在 通过 教育 游戏 识别 阅读 障 
碍 儿童 (Larco et al., 2021; Ojanen et al., 2015). fii 
着 认 知 神经 技术 的 发 展 ， 越 来 越 多 的 研究 使 用 脑 
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成 像 技 术 获 取 大 脑 的 结构 、 形 态 、 功 能 激活 和 几 
何 特性 ， 利 用 组 间 均 值 差异 来 区 分 阅读 障碍 儿童 
和 典型 发 展 儿童 (Livingston et al., 2018; Sihvonen 
et al., 2021; Yang et al., 2021)。 

然而 ， 阅 读 障碍 儿童 的 症状 具有 巨大 的 个 体 
差异 性 ， 比 如 不 同 的 病源 因素 会 导致 不 同 的 阅读 
障碍 亚 类 型 (Aaron et al., 1999)。 加 之 传统 的 阅读 
障碍 检测 技术 低 效 耗 时 ， 敏 感性 和 特异 性 指标 不 
明确 ,难以 满足 大 规模 并 快速 盘查 阅读 障碍 儿童 
的 需求 (Usman et al., 2021)。 更 重要 的 是 ,阅读 障 
但 与 多 种 神经 、 行 为 和 环境 因素 有 关 ， 这些 因素 
以 复杂 的 方式 相互 作用 导致 了 阅读 障碍 (Catts 
et al., 2017; McGrath et al., 2020)。 因 此 ， 仅 和 赁 单一 
因素 或 少数 因素 结合 无 法 完成 对 阅读 障碍 患者 的 
精确 诊断 (Catts & Petscher 2022)， 即 使 是 传统 的 
多 因素 方法 也 无 法 涵盖 所 有 可 能 的 因素 和 关系 
(Walda et al., 2022)。 研 究 复杂 系统 的 一 种 相对 新 
闫 有 效 的 方法 是 机 器 学 习 (Kaisar，2020)。 机 妖 学 
习 (Machine Learning, ML) 是 使 用 计算 机 算法 让 机 
器 从 大 量 经 验 数据 中 学 习 规 律 ， 自 动 识 别 模式 以 
做 出 预测 或 决策 (Gilvary et al., 2020)。 近 年 来 ， 因 
其 能 够 提供 更 高 的 检测 精度 和 更 好 的 预测 结 
一 些 研究 者 们 开始 尝试 应 用 机 器 学 习 来 提高 阅读 
障碍 的 盘查 的 精度 与 敏感 性 。 为 此 ， 本 研究 通过 
整合 机 器 学 习 在 阅读 障碍 筛 查 中 的 最 新 进展 、 主 
要 应 用 范围 、 未 来 可 能 的 发 展 方 向 ， 旨 在 廊 清 阅 
读 障碍 的 机 器 学 习 人 研究 可 能 的 发 展 路 径 与 发 展 


思路 。 
从 数据 库 中 获得 的 相 
关 文献 (=361) 


删除 重复 后 获得 的 文献 (n=193) 


最 终 纳入 文献 (n=25) 


通过 标题 和 摘要 往 查 阶段 的 文献 (n=33) 
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2 方法 

我 们 对 2016 年 以 来 用 于 分 类 和 识别 阅读 障 
碍 的 机 器 学 习 方法 的 研究 进行 文献 搜索 , 使 用 的 
数据 库 包 括 Web of Science, Elsevier Science 
Direct, EBSCO 和 PubMed 。 检 索 关 键 词 为 
“Dyslexia/Reading Disability” AND “Identification/ 
Screening/Detection/Recognition/Prediction/Diagno 
515” AND “Machine Learning/Deep Learning/Artificial 
Intelligence” AND “Child/Children/ Preschool”, 2 
虑 到 机 器 学 习 技 术 的 飞速 发 展 和 人 迭代, 并且 第 一 
篇 中 文 阅读 障碍 的 机 器 学 习 研 究 发 表 于 2016 年 ， 
因此 文献 检索 的 日 期 范围 设 定 为 2016 年 1 月 1 日 ~ 
2022 年 10 H 1 日 。 文 献 纳 入 标准 为 : (1) 文 献 为 英 
文 实 证 期 刊 论文 和 会 议论 文 , 全 文 可 得 并 包含 明 
确 的 研究 问题 、 方 法 和 结论 ， 研究 结论 有 翔实 的 
数据 支撑 ; (2) 研 究 对 象 为 18 岁 以 下 的 儿童 , 设置 
典型 发 展 对 照 组 和 阅读 障碍 组 。 阅 读 障碍 儿童 无 
其 他 共 病 (如 计算 障碍 、 书 写 障碍 、 自 闭 症 等 )。(3) 
文献 使 用 /组 合 使 用 机 器 学 习 方 法 得 查阅 读 隐 碍 。 
我 们 依据 上 述 标准 进行 独立 筛 查 ， 最 后 确定 纳入 
本 次 系统 综述 的 文献 数量 为 25 篇 ( 见 表 1). М1 
和 图 2 分 别 展示 了 文献 第 选 流程 和 文献 检索 完成 
后 的 文献 年 度 分 布 情况 。 


3 ”基于 机 器 学 习 的 阅读 障碍 早期 筛 查 
的 主要 步骤 

3.1 ”数据 采集 
基于 机 器 学 习 的 阅读 障碍 筛 查 的 第 一 步 是 使 


通过 其 他 来 源 ( 引 文 搜索 ) 
确认 的 文献 (n=5) 


非 英 文 实 证 文献 (n=19) 


无 关 文献 (研究 对 象 不 是 儿童 、 与 阅读 障 
碍 无 关 、 未 使 用 机 器 学 习 (n=141) 


研究 模糊 文献 (如 缺少 研究 对 象 
的 报告 、 结 论 不 清晰 (=8) 


图 1 文献 筛选 流程 图 


2016 2017 2018 2019 2020 2021 2022 
图 2 文献 检索 完成 后 的 文献 年 度 分 布 


用 相应 的 技术 手段 获取 数据 。 

标准 化 心理 教育 测试 为 机 髓 学 习 的 模型 构建 
提供 了 最 早 、 最 广泛 的 证 据 。 其 所 提供 的 数据 显 
示 了 阅读 障碍 患者 明显 的 行为 表现 ， 主 要 包括 阅 
读 、 语 音 加 工 、 工 作 记 忆 、 视 听 辨 别 等 。Chen 等 
人 (2017) 使 用 葆 兰 版 的 McArthur-Bates 沟通 发 展 
量 表 (N-CDD 测 量 了 476 名 17~35 个 月 的 典型 发 展 
儿童 的 早期 词汇 发 展 能 力 , 使 用 机 器 学 习 算 法 预 
测 具有 阅读 障碍 家 庭 风 险 的 儿童 。Shamir 等 人 
(2019) 采 用 自行 开发 的 阅读 障碍 简短 筛 查 工 具 
(Zippy 6) 测 量 了 125 名 儿童 (6~14 岁 ， 其 中 阅读 障 
碍 儿童 81 名 ) 的 认 知 能 力 和 语音 能 力 ,， 并 使 用 机 
器 学 习 算法 区 分 阅读 障碍 儿童 和 典型 发 展 儿童 。 
Tolami 等 人 (2021) 收 集 了 54 名 8-11 岁 儿 童 (29 名 
阅读 障碍 儿童 ) 的 语言 样本 ， 使 用 计算 语言 学 方法 
提取 拼写 和 语法 错误 、 词 汇 多 样 性 、 语 法 复杂 性 
指数 和 可 读 性 等 阅读 障碍 的 差异 特征 ， 利用 机 器 
学 习 模 型 诊断 阅读 障碍 。 在 中 文 阅读 障碍 人 研究 中 ， 
Wang 和 Bi (2022) 收 集 了 399 名 7~13 岁 阅 读 障碍 
儿童 的 认 知 测试 集 ， 在 测量 阅读 流畅 性 、 阅 读 准 
确 率 、 语 音 意识 、 语 素 意 识 、 快 速 命 名 和 正字 法 
意识 的 基础 上 , 使 用 深度 学 习 模 型 预测 中 文 阅读 
障碍 儿童 的 症候 。Lee 等 人 (2022) 采 集 了 1015 名 
7-13 岁 的 儿童 (454 名 阅读 障碍 儿童 ) 的 汉字 字符 
数据 集 ， 采 用 多 种 算法 对 汉字 的 反应 特征 (如 笔 
画 、 字 素 、 音 调 等 )、 字 符 结 构 、 回 答 特 征 ( 如 正字 
法 、 语 音 词根 等 )、 个 人 特征 等 分 类 变量 进行 了 机 
器 学 习 ， 最 终 基 于 汉字 字符 的 结构 、 书 写 正 确 率 、 
词汇 地 位 、 笔 画 、 音 调 、 年 级 等 核心 特征 构建 了 
中 文 阅读 障 人 得 得 查 模型 。 

值得 注意 的 是 ， 眼 动 特征 已 经 成 为 基于 机 器 
学 习 进 行 阅读 障碍 分 类 的 常用 指标 ， 它 与 机 器 学 
习 的 结合 提供 了 认 知 过 程 的 细 粒 度 信息 (Raatikainen 
et al., 2021)， 可 作为 阅读 障碍 的 高 精度 科 查 工具 。 
Bhargavi 和 Prabha (2020) 收 集 了 185 名 9-10 # Л, 
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童 (97 名 阅读 障碍 儿童 ) 的 眼 动 特征 集 用 以 建立 阅 
读 障 碍 的 预测 模型 ， 在 此 基础 上 采用 多 种 机 器 学 
习 算 法 提高 预测 精度 ,发 现 具 有 较 高 准确 率 的 最 
佳 特征 集 是 平均 注视 次 数 、 平 均 注视 时 间 、 平 均 
眼 跳 时 间 、 总 眼 跳 运 动 次 数 和 平均 注视 次 数 。Ileri 
等 人 (2022) 记 录 了 33 名 9~10 岁 儿 童 (20 名 阅读 障 
碍 儿童 ) 在 阅读 文本 时 的 眼 电 图 (electrooculography, 
EOG) 信 号 ， 通 过 机 器 学 习 分 析 了 不 同类 型 的 眼球 
运动 规律 ， 以 此 来 盘查 阅读 障碍 者 。 

随 着 智能 移动 设备 的 日 益 普 及 ， 基 于 网 络 / 手 
机 游戏 的 数据 收集 技术 拥有 了 广泛 的 用 户 基 础 。 
当前 ， 研 究 者 已 经 开发 了 各 种 文 持 、 检 测 和 治疗 
阅读 障碍 的 应 用 程序 和 游戏 (Ahmad et al., 2022). 
游戏 化 设计 大 多 以 语言 能 力 、 知 觉 加 工 、 工 作 记 
忆 、 执 行 功能 、 阅 读 技能 等 为 测量 内 容 ， 在 形式 
上 通过 丰富 的 游戏 元 素来 吸引 和 激励 用 户 。Rello 
等 人 (2020) 设 计 了 一 款 用 于 测 查 行为 和 认 知 缺陷 
的 在 线 游戏 来 收集 3644 名 7~17 岁 用 户 (其 中 包括 
392 名 阅读 障 人 得 患者 ) 的 数据 ， 从 而 建立 了 一 个 用 
于 第 查 阅读 障碍 的 机 器 学 习 模 型 。 Rauschenberger 
等 人 (2022) 通 过 网 页 游戏 “MusVis” 收 集 了 313 名 
儿童 (7~12 岁 ， 其 中 包括 116 名 阅读 障碍 儿童 ) 玩 
游戏 的 节奏 和 频率 , 在 此 基础 上 利用 机 器 学 习 进 
行 模型 训练 和 预测 。 

阅读 障碍 的 本 质 特征 是 大 脑 解剖 结构 中 微妙 
的 空间 分 布 变化 (Richlan et al., 2013; Tamboer 
et al., 2016; Vandermosten et al., 2012)。 基 于 功能 
性 磁 共 振 成 像 (fMRI)、 脑 磁 图 (MEG)、 脑 电 图 
(EEG)、 正 电子 发 射 扫描 (PET) 等 技术 获取 的 大 脑 
成 像 数 据 为 阅读 障碍 的 机 器 学 习 分 类 提供 了 客观 
证 据 (Da Silva et al., 2021; Ortiz et al., 2020; 
Thiede et al., 2020). fMRI 的 数据 大 多 关注 的 是 与 
语言 和 词汇 决策 相关 的 大 脑 区 域 ， 探 究 个 体 在 阅 
读 任 务 期 间 大 脑 激 活 的 功能 差异 (Chimeno et al., 
2014)。Zahia 等 人 (2020) 收 集 了 55 名 9 至 12 岁 西 
班 牙 儿 童 (其 中 包括 18 名 阅读 障碍 ) 的 fMRI 结构 
像 ， 使 用 深度 学 习 算法 对 阅读 障碍 儿童 进行 自动 
识别 ,Da Silva 等 人 (2021) 从 巴西 说 葡萄 牙 语 的 32 
名 8~12 岁 儿童 (16 名 阅读 障 但 儿童 ) 中 收集 高 分 辨 
ЖИ Tl-w 图 像 ， 使 用 深度 学 习 算 法 对 视觉 表征 
的 重要 区 域 进行 分 类 。EEG 能 够 在 保持 时 间 和 频 
域 的 情况 下 记录 高 时 间 分 辨 率 的 大 脑 信号 ,， 反映 
儿童 认 知 处 理 过 程 中 的 大 脑 功能 状态 ， 为 阅读 障 
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碍 的 早期 诊断 提供 有 效 特 征 。 人 研究 者 大 多 关注 
EEG 信号 的 5 个 波段 ， 即 delta, theta, alpha, beta 
和 gamma(Ortiz et al., 2020), 通过 脑 电 图 通道 之 
间 的 相位 同步 探究 大 脑 的 连通 性 ,然后 提取 鉴别 
特征 用 于 阅读 障碍 的 识别 。Zainuddin 等 人 (2019) 
采集 了 7~12 BAY 10 名 中 度 阅 读 障 碍 儿童 、10 名 
重度 阅读 障碍 儿童 和 10 名 对 照 组 儿童 的 EEG 信 
号 , 通过 写作 任务 以 К 最 邻近 (KNN) 和 极限 学 习 
机 (ELM) 来 第 查 阅读 障碍 。Formoso 等 人 (2021) 采 
集 了 7~8 岁 的 48 名 儿童 (16 名 阅读 障碍 ) 的 EEG 
言 号 ,测量 通道 之 间 的 相位 同步 ,以 揭示 听觉 处 
理 过 程 中 激活 的 脑 功能 网 络 。 然 后 ,使 用 矢量 量 
化 无 监督 学 习 和 贝 叶 斯 算法 相 结合 的 方法 提取 鉴 
别 特征 ， 用 于 阅读 障碍 的 鉴别 。 在 中 文 阅 读 障碍 
研究 中 , Cui 等 人 (2016) 采 用 结构 磁 共 振 成 像 (MRI) 
和 扩散 张 量 成 像 (DID 收集 了 61 名 10-14 岁 学 龄 
儿童 (其 中 28 名 阅读 障碍 儿童 ) 的 3D Tl-w 图 像 
(MPRAGE), 使 用 机 器 学 习 算 法 将 阅读 障碍 儿童 
与 典型 发 展 儿 童 区 分 开 来 。 

如 今 ， 越 来 越 多 的 研究 者 开始 不 局 限于 某 种 
单一 模 态 的 数据 收集 ， 他 们 将 量 表 、 行 为 、 影 像 
等 数据 进行 整合 , 试图 提高 阅读 障碍 及 其 生物 标 
志 物 检测 的 准确 性 ,纳入 分 析 的 25 篇 文献 中 使 用 
的 数据 类 型 占 比如 下 : 标准 化 心理 教育 测试 和 了 眼 
动 特征 数据 各 为 28%， 其 次 是 游戏 测试 数据 为 
16%, MRI 数据 为 12%, fMRI 数据 和 EEG 数据 各 
为 8%。 

3.2 ”数据 预 处 理 、 特 征 提取 和 特征 选择 
数据 预 处 理 的 主要 目的 是 使 算法 能 够 从 数据 
集中 提取 最 相关 的 可 解释 特征 (Usman et al., 
2021)。 对 于 传统 的 机 器 学 习 方法 ， 预 处 理 的 第 一 
步 是 将 数据 转换 为 定量 (数字 ) 或 定性 (文本 类 别 ) 
格式 。 也 有 一 些 量 表 或 行为 数据 采用 手动 预 处 理 
方式 ， 如 请 专家 将 数据 标记 为 无 阅读 障碍 组 和 阅 
读 障碍 组 (Khan et al., 2018)。 在 脑 成 像 研 究 中 ， 研 
究 者 直接 收集 的 数据 通常 是 高 维度 多 变量 的 数 
据 。 以 64 个 通道 的 EEG 数据 为 例 ， 即 使 在 一 个 
通道 上 计算 得 到 一 个 指标 ， 则 至 少 得 到 64 个 特征 
值 。 当 特征 值 数量 大 于 样本 数量 , 使 用 机 絮 学 习 
容易 造成 过 拟 合 问 题 以 及 降低 训练 和 预测 速率 。 
因此 ， 需 要 将 高 维度 的 特征 降低 到 低 维度 的 特征 ， 
加 快 后 续 机 器 学 习 的 分 类 和 训练 。 例 如 , EEG 信号 
预 处 理 中 常 采 用 主 成 分 分 析 (Principal Components 
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Analysis, РСА)Я СИ Зе ЛИТ НЕЕ, ЗНА 
据 的 降 维 (Ahire et al., 2022)。 此 外 ， 脑 成 像 数 据 还 
可 以 使 用 不 同类 型 的 软件 工具 包 进 行 预 处 理 。 如 
fMRI 图 像 可 使 用 matlab 的 SPM 工具 箱 自 动 分 割 
出 不 同 的 组 织 类 型 ， 提 高 数据 预 处 理 时 像素 和 体 
素 的 可 比 性 (Zahia et al, 2020); 或 者 使 用 
FreeSurfer 图 像 分 析 套 件 提取 可 靠 的 皮层 体积 和 
厚度 (Plonski et al., 2017). 

预 处 理 完成 的 下 一 步 是 特征 选择 和 提取 ， 目 
的 是 从 原始 特征 中 生成 最 相关 、 信 息 量 最 大 的 特 
征 (Abd Rahman et al., 2020), 形成 分 类 所 需 的 数 
据 集 。 标 准 化 心理 教育 测试 可 选择 的 特征 一 般 有 
问卷 / 认 知 测试 分 数 、 书 写 数据 、 语 音 数据 等 。 
眼 动 数据 通常 使 用 统计 上 度量、 基于 离散 和 基于 速 
度 的 算法 选择 特征 ,使 用 主 成 分 分 析 法 (Principal 
Component Analysis, PCA) 提 取 特 征 , fMRI 数据 的 
特征 提取 是 从 脑 组 织 属性 中 提取 大 脑 皮 层 属 性 特 
ЛЕ, 常见 的 特征 有 : 皮层 厚度 、 体 积 信息 、 各 向 异 
性 分 数 和 激活 模式 等 。 在 EEG 数据 中 , 一 般 使 用 
传 里 叶 变 换 和 小 波 变换 提取 信和 号 的 时 间 和 频率 信 
息 。 男 外 , 最 近 出 现 了 一 些 新 的 特征 提取 方法 ， 如 
深度 学 习 通 过 构造 不 同 的 网 络 结构 自动 从 数据 中 
进行 特征 提取 ,具有 良好 的 稳健 性 和 较 强 的 高 维 
数据 处 理 能 力 。 例 如 , 在 Jleri 等 人 (2022) 的 研究 中 ， 
卷 积 神 经 网 络 (CNN) 提 供 了 输入 的 分 段 EOG 信和 号 
的 自动 分 类 , 无需 手 动 提取 特征 。 表 2 总 结 了 纳 
人 分 析 的 25 篇 文献 中 的 特征 类 型 。 
зз ”模型 训练 与 分 类 

在 特征 提取 与 选择 完成 之 后 ,人 研究 者 便 可 以 
利用 机 器 学 习 进 行 模 型 训练 与 分 类 。 机 器 学 习 大 
致 分 为 两 种 类 型 : 无 监督 学 习 和 有 监督 学 习 。 无 
监督 学 习 用 于 在 不 使 用 任何 输出 数据 的 情况 下 查 
找 输入 数据 中 的 模式 ， 而 监督 学 习 主 要 用 于 预测 
未 来 事件 (Russell & Norvig, 2010), 在 监督 学 习 中 ， 
训练 模型 的 目的 是 从 标记 的 数据 学 习 所 有 权重 和 
偏差 的 理想 值 。 近 年 来 的 研究 一 般 使 用 监督 学 习 
算法 探究 阅读 障碍 患者 和 典型 发 展 人 群 的 分 类 问 
题 。 和 常见 的 算法 有 : 支持 问 量 机 (Support Vector 
Machines, SVM)、 决 策 树 (Decision Tree, DT), KE 
机 森林 (Random Forest，RF)、 线 性 回归 (Linear 
Regression, Linear-R)、 逻 辑 回归 (Logistic Regression, 
ГВ) 线性 判别 分 析 (Linear Discriminant Analysis, - 
LDA), ЖК N 1 (“ате Bayes), К 最 近邻 攻 -Nearest 
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表 2 机 器 学 习 在 发 展 性 阅读 障碍 儿童 早期 第 查 中 的 特征 类 型 


一 级 维度 


具体 特征 


G 


Д 


语音 加 工 : 正字 法 意识 , 语素 意识 , PRR, 字母 意识 , 快速 自动 命名 , 语音 意识 , 语音 感知 ， 


语音 流畅 性 ,语言 表 达 与 理解 ， 语 法 错误 ,语法 复杂 性 ， 语 法 可 读 性 ,词汇 多 样 性 ; 


阅读 能 力 : 阅读 速度 ， 阅 读 时 间 ， 阅 读 流畅 性 ， 阅 读 准 确 性 ， 阅 读 理解 性 ; 
: 工作 记忆 ,视觉 /听觉 工作 记忆 ， 视觉/ 听觉 辨别 和 分 类 ,视觉 注意 ， 加 工 速 度 ; 


标准 化 心理 教育 测试 ” 认 知 能 


字符 特征 : 字符 结构 ,书写 正确 率 ， 词汇 地 位 ,部 首 ， 正字 法 ,笔画 , 语音 , 首 音 , ВИ, РОМ, 


个 人 特征 
其 他 特征 


г FR, 年龄 ， 性别, 智力; 
: 沟通 发 展 量 表 (N-CDD 数 据 ， 虚 拟 迷 富 学 习 数 据 ; 


常见 的 眼 动 特征 : 注视 时 间 / 次 数 /频率 /中 位 数 长 度 / 交 叉 变 异性 /分 形 维 数 ， 眼 跳 时 间 / 次 数 /中 位 数 


其 他 眼 动 特征 : 主动 阅读 时 间 , 阅读 速度 /时 间 / 错 误 率 , 垂直 /水 平 E0G 信号 , ЕОС 信号 的 频谱 图 ; 


MRI: 白质 的 体积 /各 向 异性 分 数 /平均 弥散 率 / 轴 向 扩散 系数 / 径 向 扩散 系数 ， 灰 质 的 体积 /厚度 / 面 


眼 动 追踪 长 度 /变异 性 /距离 ， 瞬 眼 次 数 /频率 ， 回 视 ， 落 点 位 置 ， 双眼 位 置 ; 
语音 能 力 : 语言 技能 , 语言 练习 : 
ДЕЛ: 工作 记忆 ， 执行 功能 ， 感知 过 程 : 

网 络 / 手 机 游戏 ee Е А у : s 
PATHI ype ies 持续 时 间 ,， 平 均 点 击 时 间 ,间隔 时 间 ， 命 中 率 ; 
视觉 特征 : 点 击 次 数 ， 点 击 时 间 

积 / 折 闭 指数 /平均 曲率 : 

脑 成 像 技 术 Е 
fMRI: 阅读 任务 下 的 大 脑 激活 区 域 , 大 脑 激 活 差 异 ; 
EEG: 脑 功能 网 络 、beta/theta 频带 信息 

其 他 阅读 障碍 的 候选 基因 


Neighbors,KNN)、 人 工 神经 网 络 (Artificial Neural 
Network, ANN) 和 卷 积 神经 网 络 (Convolutional 
Neural Network, CNN) 等 。 在 训练 模型 前 , 通常 要 
将 整个 数据 集 分 为 测试 集 (testing set) 和 训练 集 
(training seb)。 现 有 关于 阅读 障 但 的 机 器 学 习 的 研 
究 大 多 使 用 KK 折 交 叉 验证 (K-fold cross-validation), 
将 数据 集 分 成 К 等 份 , 其 中 K-1 份 用 于 训练 集 , 1 
份 用 于 测试 集 ， 以 K 次 测试 结果 的 平均 值 作为 最 
终 的 性 能 评估 结果 。 例如 , Plonski 等 人 (2017) 采 用 
10 倍 交叉 验证 法 , AlGhamdi (2022) 采 用 5 倍 交叉 
验证 法 和 20 倍 交 又 验证 法 。 当 样本 量 较 小 时 , 一 
些 研究 者 也 会 选用 К 折 交 又 验证 的 特殊 形式 一 一 
留 一 法 (Leave-one-out cross-validation) 构 建 模 型 
和 评估 分 类 结果 (Cui et al., 2016; Asvestopoulou 
et al., 2019). 

阅读 障碍 的 识别 问题 在 本 质 上 是 二 元 分 类 问 
题 ， 即 区 分 用 户 是 否 为 阅读 障碍 者 。SVM 的 原理 
是 从 解决 线性 二 分 类 问题 出 发 ， 可 以 为 超 高 维 且 
特征 空间 稀 玖 的 数据 提供 良好 的 性 能 。 因 此, ЗУМ 
成 为 阅读 障碍 研究 中 应 用 得 最 为 广泛 的 算法 。 
Shamir 等 人 (2019) 采 用 SVM 算法 对 基于 标准 化 测 


试 和 zippy 6 盘 选 测试 的 阅读 评估 数据 进行 分 类 ， 
获得 了 75% 的 特异 性 和 灵敏 度 。Prabha 和 Bhargavi 
(2019) 提 出 一 种 粒子 群 算法 优化 支持 向 量 机 
(SVM-PSO) 模 型 用 于 从 眼 动 特征 中 提取 阅读 障碍 
的 生物 标记 物 。 与 线性 文 持 向 量 机 (Linear SVM ) 
模型 相 比 ， 该 模型 的 预测 准确 率 达 到 了 95%。 此 
外 ,研究 者 将 SVM 混合 其 他 算法 来 识别 阅读 障碍 
儿童 ,例如 , 使 用 RF 选择 最 重要 的 特征 作为 SVM 
的 输入 ,模型 达到 了 89.7% 的 准确 率 和 84.8% 的 
召回 率 (Raatikainen et al., 2021). 

对 于 大 数据 间 的 复杂 规律 的 挖掘 来 说 ， 次 度 
学 习 的 出 现 解决 了 这 一 难题 。 深 度 学 习 算 法 具有 
更 多 的 层次 结果 ,因此 对 事物 的 建 模 或 抽象 表现 
能 力 更 强 , 也 能 模拟 更 复杂 的 模型 。ANN 是 深度 
学 习 的 基础 ， 它 模拟 了 大 脑 神经 网 络 结构 和 功能 ， 
在 不 确定 的 识别 (如 语音 识别 .图 像 识别 ) 中 尤其 有 
效 (Lucchiari et al., 2014)。Ahmad 等 人 (2022) 使 
用 ANN 模型 对 综合 游戏 数据 进行 分 类 ， 获 得 了 
95% 的 检测 准确 率 。 随 着 神经 网 络 的 发 展 ， 深度 学 
习 从 浅 层 的 ANN 中 衍生 出 来 。 其 中 , CNN 是 用 于 
阅读 障碍 分 类 的 最 受 欢迎 的 深度 学 习 模 型 (Usman 
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et al., 2021)。Da Silva 等 人 (2021) 选 取 两 种 网 络 可 
视 化 技术 在 CNN 输入 层 中 学 习 高 级 特征 , 仅 从 脑 
成 像 数 据 (fMRI) 就 对 阅读 障碍 儿童 的 大 脑 状态 进 
行 了 精准 分 类 ,达到 94.8% 的 准确 率 。 不 仅 如 此 ， 
研究 者 提出 一 种 新 的 基于 EOG 信号 的 CNN 方法 
来 识别 阅读 障碍 .Latifoglu 等 人 (2021) 通 过 阅读 时 
的 跳 线 和 返回 眼球 运动 来 般 查 和 跟踪 阅读 障碍 儿 
童 。 他 们 使 用 二 维 卷 积 神经 网 络 (C2D-CNN) 模 型 对 
这 些 频 谱 图 图 像 进行 分 类 ， 获 得 了 99% 的 准确 
率 、100% 的 灵敏 度 、98.18% 的 特异 性 和 98.94% 
的 下 分 数 。Ileri 等 人 (2022) 从 水 平和 垂直 通道 记 
K ЕОС 信号 , 应 用 一 维 卷 积 神经 网 络 (1D-CNN) 
对 这 两 个 通道 的 信号 进行 分 类 ,准确 率 分 别 为 
98.70% 和 80.94%。 

事实 上 , 没有 任何 一 种 算法 能 够 成 为 适用 于 
所 有 数据 集 的 最 佳 算法 。 算 法 的 选择 受到 问题 性 
质 、 数 据 集 特征 和 数量 、 数 据 格 式 、 训 练 和 预测 
时 间 、 存 储 需 求 等 多 种 因素 的 影响 。 因 此 ,研究 
者 越 来 越 倾向 于 在 多 种 算法 中 寻找 最 佳 算法 以 获 
取 最 优 参数 。 研 究 的 整体 趋势 为 从 单一 的 传统 机 
髓 学 习 算 法 走向 深度 学 习 算 法 (Deep neural 
network，DNN) 以 及 比较 多 种 不 同类 型 的 算法 。 
Tolami 等 人 (2021) 以 语言 特征 为 分 类 指标 , 构建 
T NB, КММ, SVM, LR, DT 和 МЕР 模型 ， 其 中 属 
于 深度 学 习 的 MLP 算法 的 最 高 分 类 准确 率 达 到 
93.33%。 在 中 文 阅 读 障 碍 的 研究 中 , Lee 等 人 (2022) 
以 汉字 字符 和 个 人 特征 为 分 类 指标 , 运用 МВ, 
KNN., SVM, DT, LR 和 ANN 分 别 构建 模型 ， 发 
现 这 6 种 算法 都 可 以 将 阅读 障碍 儿童 与 典型 发 展 
儿童 区 分 开 来 。 其 中 ,SVM 获得 了 80.0% 的 最 高 
准确 率 。 

基于 纳入 分 析 的 25 篇 文献 , 算法 的 使 用 频次 
占 比 统计 如 下 : SVM 占 比 为 27.3%， 其 次 是 KNN 
All LR 615 12.7%, CNN 和 RE 各 占 9.1%, NB 和 
DT #1 5.5%, ANN & НЯ 3.6%, ВТ, 
GA-BPNN, GB, ELM, LSTM, МІР. RUSBoosted 
Al ЕТ 4 4 1.8%. 
3.4 ”性 能 评估 

阅读 障 但 的 结局 变量 均 为 二 元 分 类 变量 ,对 
于 二 分 类 结果 的 评估 首先 需要 对 于 不 同样 本 分 类 
的 分 类 结果 进行 4 类 划分 : 真 阳性 (True Positive, 
TP)、 真 阴性 (True Negative，TN)、 假 阳性 (False 
Positive, FP)、 假 了 明 性 (False Negative, FN)。 接 着 ， 
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根据 数据 的 类 别 划分 定义 评估 指标 。 对 于 二 分 类 
问题 ， 最 常用 的 评估 指标 是 整体 准确 率 。 但 是 ， 准 
确 率 只 能 体现 正 (阳性 )、 负 (阴性 ) 类 样本 合计 的 正 
确 识别 数 占 总 样本 数 的 比例 。 在 实际 应 用 中 , № 
其 是 临床 筛 查 中 往往 会 出 现 数据 中 的 正 负 样 本 量 
比例 过 大 的 问题 。 针 对 这 些 不 平衡 数据 的 分 类 问 
题 ， 需 要 采用 多 个 指标 对 分 类 模型 进行 性 能 评 
估 。 其 他 和 常用 的 评估 指标 有 : RE (Sensitivity), 
寺 异 性 (Specificity) 、 精 度 (Precision) 召回 Ж 
(Recall), F1 分 数 (Fl score), Kappa 系数 、AUROC 
曲线 与 P-R 曲线 、 阳 性 预测 值 (Positive Predictive 
Value，PV+) 与 阴性 预测 值 (Negative Predictive 
Value, РУ). ЖР ЛАУТА 25 篇 文献 ， 机 器 
学 习 模 型 的 评估 性 能 (以 准确 率 为 参考 ) 总 结 如 下 : 
标准 化 心理 教育 测试 在 68%~94.1% 之 间 ; 眼 动 追 
Е ЛЕ 81.25%-99% 之 间 ; 游戏 测试 在 
T4%~99.9%Z [8]; 基于 EEG 捕获 的 脑 成 像 数 据 在 
89%~90%Z |8]; 基于 fMRI 捕获 的 脑 成 像 数 据 在 
65%~94.83% Z [Н] o 


4 РАЕН 
的 研究 应 用 


4.1 发 现 阅读 障碍 的 预测 因素 

机 需 学 习 最 主要 的 优势 在 于 模型 的 灵活 度 ， 
即 可 以 拟 合 相 当 复 杂 的 多 项 交互 关系 或 者 非 线性 
关系 , 由 此 产生 令 人 瞩目 的 预测 准确 性 。 特 别 是 
研究 涉及 到 预测 性 问题 ， 如 预测 微 博 用 户 的 自杀 
风险 、 抑 郁 症 的 易 感人 群 等 ,机 器 学 习 的 统计 效 
果 尤 其 突出 。 

基于 机 器 学 习 有 助 于 发 现 阅 读 障 人 碍 的 预测 因 
K, 我 们 可 以 有 效 检 出 具有 阅读 障 但 风险 的 儿童 
对 其 进行 及 时 干预 ,从 而 减 小 儿童 识字 后 甚至 成 
年 后 阅读 失败 的 可 能 性 ,例如 , Tamboer 等 人 (2016) 
BB MRI 技术 构建 SVM 预测 模型 ， 发 现 最 可 靠 
的 分 类 体 素 位 于 左 侧 枕 叶 梭 状 回 (Left Occipital 
Fusiform Gyrus, LOFG)、 右 侧 枕 叶 梭 状 回 (Right 
Occipital Fusiform Gyrus, ROFG) 和 左 侧 顶 下 小 叶 
(Left Inferior Parietal Lobule, LIPL), 敏感 性 达到 
82%， 特 异性 达到 78%。 因 此 , 这 些 脑 区 是 与 阅 
读 、 拼 写 和 语音 相关 的 阅读 障碍 类 型 的 潜在 生物 
标志 物 。 Prabha 和 Bhargavi (2019) 基 于 SVM-PSO 
构建 的 预测 模型 显示 , 平均 注视 次 数 、 平 均 注视 
时 间 、 平 均 扫 视 时 间 、 总 扫 视 次 数 和 平均 注视 次 
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数 等 眼 动 特征 可 以 作为 儿童 阅读 障碍 的 风险 预测 
指标 。 该 模型 预测 的 准确 率 高 达 95%。Formoso 
等 人 (2021) 收 集 儿童 的 EEG 信号 , 通过 脑 电 通道 
之 间 的 相位 同步 来 表示 脑 区 之 间 的 连通 性 。 研 究 
结果 显示 在 16 Hz 的 刺激 下 , alpha 和 beta 波段 的 
辨别 能 力 最 强 , AUC 值 达 到 0.95。 在 中 文 阅读 障 
碍 的 研究 中 ，Wang 和 Bi (2022) 构 建 了 基于 遗传 
算法 - 反 向 传播 神经 网 络 模型 (GA-BPNN) 的 中 
文 阅 读 障 人 碍 预测 模型 ， 发现 阅读 准确 性 是 预测 
汉语 阅读 困难 儿童 的 最 强 因素 , 语音 意识 、 假 字 
准确 率 、 语 素 意 识 、 阅 读 流畅 性 、 快 速 数字 命名 
和 非 字 符 反 应 时 间 对 预测 也 具有 重要 贡献 。 基 于 
纳入 本 次 系统 综述 的 文献 最 具 预 测 性 的 特征 
总 结 详 见 表 Зо 

42 ”辅助 得 查阅 读 障 碍 儿童 

阅读 障碍 儿童 的 传统 得 查 主要 通过 专业 的 医 
疗 机 构 和 科研 机 构 进 行 , 方法 以 标准 化 心理 教育 
测试 结合 儿童 外 在 行为 和 家 长 报告 为 主 。 虽 然 近 
年 来 腿 劲 追踪 和 脑 成 像 技 术 为 阅读 障 但 得 查 提供 
ВЖЕ, 但 通过 这 些 复 杂 的 测量 
工具 来 对 每 一 个 阅读 障碍 患者 进行 大 范围 识别 几 
乎 是 不 可 能 的 。 同 时 ,这 些 测 量 工 具 还 存在 着 价 
格 昂贵 、 耗 时 长 、 普 及 性 差 、 就 诊 渠道 罕 等 弊端 。 
为 此 ， 机 器 学 习 被 用 来 辅助 临床 筛 查 和 自动 化 识 
别 , 不 仅 可 以 纳入 大 量 客观 分 类 指标 提高 准确 率 ， 
而 且 方 便 快 捷 ， 降 低 等 待 成 本 。 

Asvestopoulou 等 人 (2019) 开发 了 一 款 阅 读 
Рену Г.А. DysLexML， 通 过 眼 动 追踪 记录 
儿童 默读 期 间 的 注视 点 , 应 用 LSVM 构建 第 查 模 
型 ， 准 确 率 达到 97%。 值 得 一 提 的 是 , DysLexML 
在 存在 噪声 的 情况 下 依然 具有 良好 的 稳健 性 和 准 
确 率 。 因此, DysLexML 可 以 覆盖 更 多 数量 和 更 多 
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样 化 的 人 群 ,为 在 控制 较 少 、 规 模 较 大 的 环境 中 
(如 幼儿 园 ) 开 发 廉价 的 眼 动 筛 查 工 具 黄 定 了 基础 。 

以 往 研 究 认 为 ， 阅 读 障碍 与 虚拟 Hebb- 
Williams 迷宫 任务 的 表现 相关 , 但 是 通过 实时 观 
察 任务 表现 来 对 阅读 障碍 儿童 进行 分 类 尚 不 可 行 
(Gabel et al., 2021). Уи 等 人 (2022) 基 于 机 器 学 习 
算法 开创 性 地 根据 迷宫 任务 的 表现 预测 阅读 能 力 ， 
实现 以 阅读 风险 的 百分比 形式 实时 反馈 阅读 成 
绩 。 他 们 以 虚拟 迷宫 数据 、 阅 读 水 平和 个 人 特征 
为 指标 ,利用 RUSBoosted 树 算 法 (RUSBoosted 
Trees algorithm) 构 建 的 模型 分 类 准确 率 达 到 70% 
以 上 。 随 着 计算 机 网 络 的 发 展 和 电子 产品 的 普及 ， 
以 在 线 评估 平台 或 应 用 程序 初步 租 查 阅读 障 但 的 
方式 逐渐 流行 起 来 。 研 究 者 开发 了 一 款 分 析 真 实 
环境 下 音频 信号 的 应 用 程序 Dystech， 他 们 发 现 
与 适当 的 音频 信号 处 理 相 关 的 机 絮 学 习 算法 可 以 
提取 出 人 类 专家 无 法 获取 的 模式 ， 筛 查 准 确 率 达 
到 80%(Radford et al., 2021). Rauschenberger 等 人 
(2022) 设 计 了 一 和 亚 语言 独立 游戏 MusVis, 使 用 RF 
和 额外 树 (Extra trees，ET) 对 收集 到 的 游戏 的 数据 
进行 训练 ,德语 和 西班牙 语 阅 读 障 但 的 分 类 准确 
率 分 别 达 到 74% 和 69%。 
43 预测 阅读 障碍 高 风险 儿童 

人 们 普遍 认 为 阅读 障碍 具有 遗传 基础 ( 约 
70%) ( 苏 萌 萌 等 , 2012; Galaburda et al., 2006)。 即 
使 部 分 有 家 庭 风险 的 儿童 没有 出 现 阅 读 障 碍 ， 但 
是 他 们 在 拼写 、 非 单词 阅读 和 阅读 理解 等 任务 上 
的 表现 仍然 比 典 型 发 展 儿 童 要 差 (Lyytinen et al., 
2005). 在 早期 发 现 具 有 高 风险 的 阅读 障碍 的 儿童 
将 使 早期 预防 和 干预 成 为 可 能 。 这 种 早期 预测 功 
能 可 通过 训练 机 器 学 习 预 测 模 型 来 实现 。Skeide 
等 人 (2016) 认 为 与 识字 相关 的 重要 脑 区 的 神经 可 


表 3 机 器 学 习 在 发 展 性 阅读 障碍 儿童 早期 筛 查 中 最 具 预 测 性 的 特征 


结构 ， 词 汇 量 ， 年 级 ; 


异 癌 眼 动 ,注视 交叉 变异 性 ,注视 次 数 /持续 时 间 ， 眼 跳 次 数 /持续 时 间 / 长 度 , 短 前 向 移动 个 数 ， 


MRI: NRSN1 相关 的 “视觉 单词 形成 区 ”的 灰质 体积 , 假定 阅读 系统 内 /边缘 系统 /运动 系统 的 白 


质 区 域 , 左 半球 外 侧 裂 周 区 有 额外 裙 皱 的 非典 型 曲率 模式 ; 


一 级 维度 最 具 预 测 性 的 特征 
标准 化 心理 教育 测试 阅读 准确 性 ， 笔 画 ， 词 汇 地 位 ， 
眼 动 追踪 не a 
oot 多 重 注视 词 个 数 ， 水 平 BOG 信和 号: 
网 络 / 手 机 游戏 视觉 /听觉 点 击 总 次 数 ， 视觉/ 听觉 第 一 次 点 击 时 间 ; 
脑 成 像 技 术 


fMRI: 左 侧 枕 叶 ， 顶 下 小 叶 ， 右 侧 前 额 叶 ; 
EEG: beta 频带 信息 , db2 小 波 , db4 小 波 
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塑性 可 能 受到 遗传 变异 的 调控 ,从 而 预先 限制 了 
儿童 的 读 写 能 力 。 为 此 ， 他们 采集 了 4~8 ЕЛ, 
童 和 幼儿 园 ~1 年 级 儿童 的 灰 / 白 质 体积 以 及 与 识 
字 相 关 的 基因 信息 ,利用 LSVM 构建 了 阅读 障碍 
的 预测 模型 ， 其 准确 率 分 别 达到 了 73% 和 75%. 
Chen 等 人 (2017) 根据 词汇 发 展 量 表 分 析 了 17~35 
个 月 的 儿童 的 词汇 总 量 和 词汇 类 别 的 群体 水 平 差 
я, 使 用 SVM 来 对 家 庭 风险 的 阅读 障碍 儿童 和 典 
型 发 展 儿童 进行 分 类 。 研 究 结 果 显 示 风 险 预 测 模 
型 的 准确 率 为 68%， 敏 感性 为 70%， 特 异性 为 
67%， 表 明 通 过 机 器 学 习 可 以 在 识字 前 的 早期 阶 
段 区 分 出 有 家 庭 风险 的 阅读 障碍 儿童 和 典型 发 展 
儿童 。 这 个 阶段 有 家 庭 风险 的 阅读 障碍 儿童 的 杜 
顶 叶 和 杜 枕 叶 区 域 已 经 显示 出 功能 和 结构 上 的 改 
变 , 并 且 类 似 于 阅读 障碍 患者 中 观察 到 的 变化 
(Hosseini et al., 2013; Kraft et al., 2015). 


5 机 器 学 习 应 用 于 儿童 阅读 障碍 早期 
第 查 的 优势 与 不 足 


51 优势 

近年 来 ， 机 器 学 习 在 阅读 障碍 及 其 生物 标志 
物 检测 中 的 应 用 越 来 越 受到 研究 者 的 青睐 ,其 优 
势 主要 体现 在 以 下 三 个 方面 。 第 一 ， 机 需 学 习 可 
以 识别 变量 之 间 复 杂 的 非 线性 关系 ， 提 供 对 阅读 
障 人 得 更 加 精准 的 得 查 与 发 展 性 预测 。 阅 读 障 碍 是 
多 种 因素 相互 作用 的 结果 (Morris et al., 1998), 传 
统 的 统计 学 方法 (如 人 逻辑 回归 ) 所 确定 的 单个 或 多 
个 预测 因子 存在 预测 能 力 弱 或 是 无 法 体现 因子 间 
的 交互 作用 的 缺点 ,不 能 对 数据 进行 充分 挖掘 。 
机 器 学 习 则 更 适合 分 析 阅 读 障 和 碍 这 一 类 结构 复杂 
问题 。 以 反 向 传播 神经 网 络 (BPNN) 为 例 BPNN 
作为 人 类 大 脑 工 作 机 制 的 模拟 , 不 仅 可 以 处 理 模 
糊 映射 关系 , 还 可 以 识别 变量 之 间 复 杂 的 非 线 性 
关系 (Lyu & Zhang, 2019). 无 论 是 在 字母 语言 还 是 
汉语 中 ,通过 采集 与 阅读 相关 的 认 知 测试 或 语音 
测试 数据 ，BPNN 模型 缘 可 有 效 筛 查 出 阅读 障碍 
儿童 (Wang & Bi, 2022)。 第 二 ， 与 人 为 识别 阅读 障 
碍 的 方式 相 比 ,机 器 学 习 一 方面 避免 了 主观 理解 
偏差 的 影响 ， 另 一 方面 能 够 自动 化 重复 的 任务 ， 
在 更 短 的 时 间 内 分 析 更 多 的 数据 ， 实现 比 人 工 算 
法 更 高 的 准确 性 和 可 重复 性 。 第 三 ， 机 器 学 习 具 
备 强大 的 高 维 数据 处 理 能 力 ， 可 从 脑 成 像 数 据 中 
提取 出 额外 的 、 关 键 性 的 区 辨 性 信息 ,检测 到 人 
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眼 无 法 观测 到 的 可 能 反映 重要 病理 生理 机 制 的 微 
小 成 像 的 异常 。 大 脑 功能 和 发 育 的 差异 是 阅读 障 
碍 风险 的 早期 迹象 。 随 着 年 龄 增长 ， 突 触 的 快速 
形成 使 得 儿童 大 脑 的 激活 模式 发 生变 化 ,但 除非 
严重 受伤 或 病危 ， 大 脑 结构 从 童年 到 成 年 保持 不 
变 。 因 此 , 高 维 的 脑 成 像 数 据 可 为 阅读 障 但 的 识 
别提 供 更 准确 的 结果 。 例 如 , Da Silva 等 人 (2021) 
从 大 脑 成 像 对 发 展 性 阅读 障碍 儿童 进行 了 94.8% 
的 准确 分 类 ,同时 利用 特征 可 视 化 技术 (CAM) 和 
基于 梯度 的 特征 可 视 化 技术 (Grad-CAM) 在 卷 积 
神经 网 络 层 负 责 学 习 高 级 特征 ， 提供 了 阅读 障碍 
儿童 和 典型 发 展 儿 童 在 阅读 的 策略 控制 和 注意 过 
程 中 相关 的 大 脑 区 域 的 可 视 化 图 像 。 这 种 在 切片 
水 平 上 对 大 脑 状态 的 预测 ， 以 及 随后 生成 的 与 分 
类 相关 的 更 细 粒 度 的 特征 信息 可 以 提高 模型 的 可 
解释 性 。 
5.2 МЕ 

首先 ， 缺 少 对 最 佳 干预 期 的 被 试 群体 研究 。 
阅读 障碍 具有 可 遗传 性 ，68% 的 同 卵 双胞胎 和 高 
ІК 40%~60% 的 一 级 亲属 之 间 共 同 患 有 阅读 障碍 
(Vogler et al.，198$)。 几 个 阅读 障碍 的 候选 基因 ， 
如 ROBO1, DCDC2, DYX1C1, KIAA0319, 已 经 
证 实在 儿童 的 大 脑 发 育 中 发 挥 着 重要 作用 
(Galaburda et al., 2006)。 儿 童 的 大 脑 可 塑性 增强 的 
早期 阶段 处 于 幼儿 园 至 小 学 1 年 级 期 间 ， 是 阅读 
障碍 早期 干预 的 最 佳 时 期 (Fox et al., 2010)。 研 究 
发 现 ,对 幼儿 园 和 1 年 级 的 高 危 阅 读 障碍 儿童 进 
行 有 效 干 预 的 效果 (平均 效应 量 为 0.31~0.84) 远 高 
于 2 年 级 和 3 年 级 的 高 危 阅读 障碍 儿童 (平均 效应 
量 为 0.23~0.27) (Wanzek & Vaughn, 2007). 为 此 ， 
在 最 佳 干预 期 之 前 对 阅读 障碍 儿童， 尤其 是 对 有 
家 庭 风 险 的 阅读 障碍 儿童 进行 精准 的 早期 识别 至 
关 重 要 ,遗憾 的 是 ， 基于 上 述 回 顾 的 所 有 文献 ， 仪 
有 一 项 机 器 学 习 的 阅读 障碍 研究 的 被 试 年 龄 较 小 
(17-35 个 月 )， 其 余 研 究 中 被 试 年 龄 段 在 6-17 % 
ZE, 儿童 识字 前 (3~7 岁 ) 这 一 阶段 的 研究 几乎 是 
空白 *。 未 来 研究 需要 在 儿童 识字 前 广泛 收集 他 们 
及 一 级 亲属 的 相关 数据 ， 关 注 遗 传 和 环境 中 可 能 


”笔者 注 : Skeide 等 人 (2016) 的 研究 共 141 名 被 试 ， 其 中 20 
名 被 试 年 龄 为 5~6 岁 。 这 20 名 被 试 在 5~6 之 间 进 行 MRI 
扫描 , 约 1.7 年 后 的 7~9 岁 左右 进行 识字 能 力 评估 ,因此 在 
此 处 未 纳入 3~7 岁 的 范畴 。 
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的 风险 因素 ,建立 多 模 态 数据 库 ， 借 助 机 器 学 习 
的 强大 分 类 功能 往 选 阅读 障碍 儿童 并 确立 较为 稳 
定 的 行为 /生物 标记 物 ， 最 终 搭建 方便 、 快 捷 、 精 
准 、 科 学 的 早期 第 查 系统 。 

НАХ, 机 带 学 习 人 研究 中 采集 的 数据 质量 参差 
МЭР, 采集 标准 不 统一 ,数据 样本 不 足 。 基 于 机 融 
学 习 的 阅读 障碍 数据 库 采集 呈现 单一 数据 库 到 多 
方 数据 库 、 单 一 模 态 到 多 模 态 的 趋势 。 由 于 数据 
库 来 自 不 同 的 实验 室 和 不 同 的 人 群 ,采集 标准 尚 
未 统一 ， 数 据 分 布 的 特征 不 同 , 大 量 的 数据 不 兼 
容 、 结 构 复 杂 。 因 此 有 必要 建立 标准 化 异 构 数据 
库 , 提高 模型 所 需 的 计算 力 ， 避免 资源 浪费 ,采集 
标准 不 统一 的 现象 尤其 充斥 于 阅读 障碍 儿童 的 脑 
成 像 数据 库 。 一 方面 ,成 像 设备 型 号 、 参 数 不 统 
一 会 对 数据 质量 产生 一 定 影响 。 由 于 缺乏 权威 、 
固定 的 标准 ， 脑 成 像 的 可 重复 性 得 不 到 一 致 认 
可 。 田 一 方面 , 分 类 的 准确 率 在 很 大 程度 上 取决 
于 样本 量 大 小 。 相 较 于 问卷 、 行 为 数据 ,各 诬 题 
组 公开 / 非 公 开 的 阅读 障碍 相关 数据 库 中 脑 成 像 
数据 量 较 少 。 用 小 样本 训练 的 模型 很 容易 陷入 对 
小 样本 的 过 拟 合 以 及 对 目标 任务 的 欠 拟 合 。 针 对 
以 上 问题 ,首先 可 以 通过 国际 合作 建立 数据 采集 
以 及 数据 共享 的 统一 标准 的 平台 ,实现 脑 成 像 数 
据 的 可 重复 性 应 用 。 其 次 ,可 以 通过 增多 训练 数 
据 、 缩 小 模型 需要 搜索 的 空间 和 优化 搜索 最 优 模 
型 的 过 程 等 方式 进行 补救 。 

再 者 ,暂时 无 法 在 临床 实践 中 达到 高 转化 力 
并 得 到 更 广泛 的 使 用 。 虽然 大 量 的 研究 发 现 大 脑 
形态 、 眼 球 运动 和 正常 听觉 系统 中 检测 到 的 变化 
可 以 作为 阅读 障碍 识别 的 神经 生物 标记 物 , 但 传 
统 门 诊 对 于 阅读 障碍 的 得 查 依旧 以 标准 化 心理 教 
育 测试 (行为 标记 ) 为 主 。 这 是 由 于 标准 化 心理 教育 
测试 具有 测验 内 容 有 代表 性 、 标 准 化 程度 高 、 信 
效 度 高 和 使 用 方便 经 济 等 优点 。 机 融 学 习 目 前 沿 
不 具备 临床 转化 的 必 备 条 件 。 首 先 ,训练 数据 从 
缺 代表 性 。 实 验 数 据 通常 是 在 控制 实验 无 关 变 量 
的 前 提 下 寻求 对 典型 样本 的 估计 , 但 如 果 我 们 的 
目的 是 是 创建 可 推广 的 预测 算法 , РЕЖЕ 
际 生 活 中 大 量 的 个 体 化 病例 。 其 次 ， 机 器 学 习 模 
型 可 解释 性 和 透明 度 低 。 存 在 “算法 黑箱 ” 输入 的 
数据 和 输出 答案 之 间 存 在 不 可 观察 的 空间 ， 甚 至 
开发 人 员 都 不 能 完全 理解 算法 运作 的 具体 细节 。 
再 者 ， 机 融 学 习 的 性 能 指标 不 具备 临床 适用 性 ， 
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ЩИ Fl 分 数 、 召 回 率 可 能 无 法 适用 于 临床 环境 ,很 
难 被 临床 医生 和 研究 人 员 理 解 。 最 后 , 干预 方法 
的 验证 研究 不 足 。 阅 读 障碍 的 早期 第 查 的 最 终 目 
的 是 为 了 给 儿童 提供 行 之 有 效 的 早期 干预 。 但是， 
目前 仪 有 两 项 研究 将 机 器 学 习 与 阅读 障碍 干预 联 
系 起 来 (Atkar & Jayaraju, 2021; Oliaee et al., 
2022)。 之 前 对 基于 机 器 学 习 的 阅读 障碍 的 EEG 
人 研究 主要 是 通过 脑 电 图 的 组 间 差 异 (特别 是 单个 
频段 的 功率 ) 来 区 分 阅读 障碍 儿童 和 典型 发 展 儿 
童 。Oliaee 等 人 (2022) 开 创 性 地 对 特定 治疗 计划 前 
后 的 阅读 障碍 儿童 进行 分 类 ， 为 评估 阅读 障碍 治 
疗 方案 的 有 效 性 提供 了 新 的 方法 。 他 们 利用 PCA 
和 序列 前 向 选择 (Sequential Floating Forward 
Selection，SFFS) 算 法 ， 从 记录 的 脑 电 图 信号 中 提 
取出 最 优 特征 子 集 ， 发 现 阅读 障碍 儿童 在 接受 经 
颅 直 流 电 刺激 (Transcranial Direct Current 
Stimulation，tDCS) 治 疗 和 认 知 训练 前 后 的 脑 电信 
号 在 不 同 区 域 的 频谱 和 相位 相关 特征 上 发 生 了 显 
著 变 化 ,最 具 识 别 力 的 特征 子 集 的 分 类 准确 率 达 
到 92%。Atkar 和 Jayaraju (2021) 使 用 一 种 深度 学 
习 - 无 监督 学 习 的 生成 对 抗 网 络 模型 (Generative 
Adversarial Networks，GAN) 生 成 两 个 或 三 个 字母 
的 印 地 语 单词 的 原始 音频 数据 , 使 用 生成 的 数据 
建立 MelGAN 系统 。 该 系统 通过 让 阅读 障碍 儿童 
重复 单词 的 正确 发 音 来 加 快 恢复 过 程 ， 旨 在 为 教 
师 提 供 一 个 有 效 的 辅助 工具 。 虽 然 使 用 机 器 学 习 
评估 干预 效果 以 及 辅助 创建 干预 工具 开始 走 进 研 
究 人 员 的 视野 , 但 它们 的 实用 性 和 可 验证 性 仍 有 
竺 进一步 提高 。 

最 后 ,被 试 的 数据 安全 和 隐私 保护 受到 威 
胁 。 机 器 学 习 模 型 训练 需要 大 量 数据 , 但 数据 库 
往往 包含 大 量 隐 私 数据 ， 如 个 人 身份 信息 、 家 庭 
言 息 等 。 如 何 低 成 本 且 高 效 地 防止 隐私 泄漏 变 得 
极为 重要 。Usman 和 Muniyandi (2020) 构 建 了 一 种 
基于 CNN 模型 和 余数 模型 (RNS) 进 行 阅读 障碍 安 
全 分 类 的 方法 ,他们 利用 RNS 的 特殊 模块 集 开 发 
了 一 个 像素 -比特 流 编码 器 ,在 使 用 级 联 CNN 进 
行 分 类 之 前 对 训练 集 和 测试 集中 MRI 数据 的 每 个 
像素 的 7 位 二 进 制 值 进行 加 密 ， 再 使 用 加 密 测 试 
数据 集 预 测 阅 读 障碍 儿童 。 此 外 , 在 数据 共享 之 
前 制定 知情 同意 、 伦 理 审核 同样 有 利于 防止 潜在 
的 数据 滥用 。 
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碍 的 早期 盘查 中 。 数 据 采 集 方 式 从 单一 模 态 向 多 
模 态 的 异 构 数 据 转变 ,并 使 用 多 种 模型 验证 最 佳 
分 类 效果 , 分 类 性 能 在 67%~100% 之 间 。 当 前 使 
用 最 多 的 机 器 学 习 算 法 是 SVM， 未 来 深度 学 习 有 
望 为 阅读 障碍 实现 更 高 的 分 类 性 能 。 在 应 用 中 ， 
阅读 障碍 的 机 器 学 习 研 究 仍 存在 样本 量 少 、 临 床 
实践 率 低 、 多 模 态 数据 结合 不 足 、 分 类 性 能 有 待 
提高 等 问题 。 并 且 ， 缺 少 对 最 佳 干 预期 的 儿童 群 
体 研 究 , 没有 真正 实现 阅读 障碍 儿童 的 早期 得 
查 。 未 来 的 研究 首先 应 重点 关注 学 龄 前 儿童 的 风 
险 识别 ， 着眼 于 阅读 障碍 的 早期 第 查 的 标记 物 研 
究 。 其 次 , 由 于 阅读 障碍 并 不 特定 于 某 个 地 区 、 
语言 和 文化 ， 因 此 需要 开发 独立 于 语言 的 数据 收 
集 方法 以 建立 统一 标准 的 阅读 障碍 数据 库 。 最 后 ， 
未 来 的 研究 需要 采集 多 个 来 源 数据 (如 量 表 、 行 
为 、 脑 成 像 等 )、 混 合 多 种 模型 以 及 考虑 多 模 态 的 
深度 学 习 框 架 提高 机 器 学 习 的 预测 力 ， 不 断 优 化 
构建 的 阅读 障碍 往 查 模型 ， 最终 实现 临床 实践 中 
的 广泛 使 用 。 
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Application of machine learning in early screening 
of children with dyslexia 


BU Xiaoou, WANG Yao, DU Yawen, WANG Pei 
(Department of Special Education, Faculty of Education, East China Normal University, Shanghai 200062, China) 


Abstract: Developmental dyslexia is the most prevalent form of specific learning disorder with a 
neurobiological basis that not only restricts an individual's academic achievement and career development, 
but also negatively affects an individual's psychological and social adjustment substantially. Recently, 
machine learning has been gradually applied to the early screening of children with dyslexia due to its 
powerful data processing and mining capabilities, accumulating richer results in various aspects such as 
standardized psychoeducational testing, eye tracking, game testing and brain imaging. However, machine 
learning still has limitations in terms of participant selection, data collection, transformation potential, 
security and privacy. Future researches need to focus on the early identification of pre-school children with 
dyslexia, construct multimodal data, and find the best classifier among multiple classifiers to obtain optimal 
parameters, which will eventually achieve widespread use in clinical practice. 
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